년 3분기 AI 및 로봇 연구 동향
1. 서론
1.1 년 AI 및 로봇 연구 환경 개관
2015년은 인공지능(AI), 특히 딥러닝 기술이 학문적 가능성을 넘어 산업계 전반으로 그 영향력을 본격적으로 확장하기 시작한 중대한 전환점이었다. 이 시기 AI 기술은 이미지 인식과 같은 특정 작업에서 인간의 능력을 넘어서는 성과를 보이기 시작했으며, 전문가들은 전문화된 AI 분야의 급속한 발전이 계속될 것으로 예측했다.1 그러나 이러한 기술적 낙관론 이면에는 지능형 기계가 인간의 일자리를 대체할 것이라는 사회적 우려 또한 팽배했다.2 특히 2015년 3분기는 이후 수년간 AI 연구 개발의 방향성을 결정지은 근본적인 기술들이 대거 발표된 시기로 기록된다. 이 시기에는 알고리즘의 안정성과 훈련 효율성을 획기적으로 개선하려는 공학적 접근이 심화되었으며, 동시에 AI 기술의 사회적 적용과 그에 따른 윤리적, 실용적 문제를 조명하는 중대한 사건들이 발생했다.3
이러한 배경 속에서 2015년 3분기는 AI 기술의 내적 성숙과 외적 확장이 교차하는 중요한 변곡점을 형성했다. 한편에서는 딥러닝과 강화학습의 근본적인 한계를 극복하기 위한 이론적, 방법론적 돌파구가 마련되었고, 다른 한편에서는 선도적인 AI 연구 그룹들이 의료와 같은 고도의 사회적 책임이 요구되는 영역으로 기술 적용을 시도하며 복잡한 현실 세계의 문제들과 직면하기 시작했다. 본 보고서는 이처럼 역동적이었던 2015년 3분기의 주요 학술 발표와 산업계 동향을 심층적으로 분석하여, 당시의 기술적 성취가 현재 AI 기술 지형에 어떠한 영향을 미쳤는지 그 궤적을 추적하고 조명하는 것을 목표로 한다.
1.2 분기 주요 학술 동향 및 기술적 변곡점 요약
2015년 3분기는 세계 최고 수준의 AI 및 로봇 공학 관련 학술대회가 집중적으로 개최된 시기였다. 7월에는 머신러닝 분야의 International Conference on Machine Learning (ICML) 4, 로봇 공학 이론 분야의 Robotics: Science and Systems (RSS) 5, 그리고 범용 인공지능 분야의 International Joint Conference on Artificial Intelligence (IJCAI) 6가 연이어 열렸다. 9월 말에는 지능형 로봇 및 시스템 분야의 최대 학회 중 하나인 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)가 시작되었다.7 이들 학회는 각 분야의 연구자들이 최신 성과를 공유하고 미래 연구 방향을 논의하는 핵심적인 장으로서, 이 시기 기술 발전의 흐름을 명확하게 보여준다.
이 시기의 학술 동향은 추상적인 이론의 힘이 실질적이고 복잡한 사회적 응용 및 그에 따른 도전 과제로 전환되는 중요한 변곡점을 나타낸다. 한편으로는 AI 모델의 훈련 과정을 더 빠르고, 안정적이며, 신뢰할 수 있게 만드는 것을 목표로 하는 근본적인 알고리즘 개선 연구들이 발표되었다. 예를 들어, ICML 2015에서는 딥러닝 훈련의 불안정성 문제를 해결하기 위한 ‘배치 정규화(Batch Normalization)’ 8와 강화학습의 불안정한 업데이트 문제를 해결하기 위한 ‘신뢰 영역 정책 최적화(Trust Region Policy Optimization)’ 9와 같은 연구가 발표되었다. 이는 기술이 성숙 단계에 접어들면서 나타나는 공학적 안정성 확보에 대한 집중을 보여준다.
다른 한편으로는, 주요 산업계 연구소들이 AI 기술을 의료와 같은 매우 민감하고 규제가 심한 현실 세계의 영역에 직접 적용하기 시작하면서 복잡한 윤리 및 개인정보보호 문제가 즉각적으로 수면 위로 부상했다. 2015년 9월, 딥마인드가 영국 국민보건서비스(NHS)와 체결한 첫 번째 대규모 의료 데이터 파트너십 11은 그 대표적인 사례이다. 이 사건은 강력한 AI 도구가 실험실을 떠나 사회 구조와 충돌할 때 발생하는 문제들을 여실히 보여주었다. 이후의 분석들에서 드러났듯이, 이 협약은 데이터 프라이버시, 환자 동의, 투명성 문제에 대한 심각한 사회적 논쟁을 촉발시켰다.12 따라서 2015년 3분기의 사건들은 AI 분야가 단순히 추상적인 문제를 더 잘 해결하는 것을 넘어, 그 성공의 실질적이고 윤리적인 결과를 처음으로 대규모로 마주하게 된 중대한 전환기였음을 시사한다.
아래 표는 본 보고서에서 중점적으로 다룰 2015년 3분기 주요 학술대회를 요약한 것이다.
| 학회명 (Conference Name) | 약어 (Acronym) | 개최 기간 (Dates) | 개최 장소 (Location) | 주요 분야 (Primary Field) |
|---|---|---|---|---|
| International Conference on Machine Learning | ICML 2015 | 2015년 7월 6일 – 11일 | 프랑스, 릴 | 머신러닝 |
| Robotics: Science and Systems | RSS 2015 | 2015년 7월 13일 – 17일 | 이탈리아, 로마 | 로봇 공학 이론 |
| International Joint Conference on Artificial Intelligence | IJCAI 2015 | 2015년 7월 25일 – 31일 | 아르헨티나, 부에노스아이레스 | 범용 인공지능 |
| IEEE/RSJ International Conference on Intelligent Robots and Systems | IROS 2015 | 2015년 9월 28일 – 10월 2일 | 독일, 함부르크 | 지능형 로봇 및 시스템 |
2. 제32회 국제 머신러닝 학회 (ICML 2015): 딥러닝의 근본적 진보
2.1 개요
2015년 7월 6일부터 11일까지 프랑스 릴에서 개최된 제32회 국제 머신러닝 학회(ICML 2015)는 딥러닝 기술이 직면한 실용적 한계를 극복하기 위한 핵심적인 방법론들이 발표된 중요한 학술적 장이었다.4 총 1037편의 논문이 제출되어 그중 270편이 채택되는 높은 경쟁률을 기록했으며, 이는 당시 머신러닝 분야의 폭발적인 연구 열기를 반영한다.17 특히 이 해의 ICML에서는 심층 신경망의 훈련 과정 자체를 근본적으로 개선하여 안정성과 효율성을 획기적으로 향상시킨 두 편의 기념비적인 연구, ’신뢰 영역 정책 최적화(TRPO)’와 ’배치 정규화(Batch Normalization)’가 발표되어 학계와 산업계의 지대한 주목을 받았다. 이들 연구는 딥러닝 기술이 단순한 ’가능성’의 단계를 넘어, 신뢰할 수 있고 확장 가능한 ’공학’의 단계로 진입하고 있음을 보여주는 명백한 신호였다.
2.2 심층 강화학습의 이론적 토대 구축: 신뢰 영역 정책 최적화 (Trust Region Policy Optimization, TRPO)
강화학습, 특히 심층 신경망을 정책 함수로 사용하는 심층 강화학습은 2015년 당시 가장 역동적인 연구 분야 중 하나였다. 그러나 기존의 정책 경사(Policy Gradient) 기반 방법론들은 중대한 안정성 문제를 내포하고 있었다. 정책 업데이트의 크기를 결정하는 학습률(learning rate 또는 step size)에 따라 훈련 성능이 극심하게 변동했으며, 단 한 번의 과도한 업데이트가 학습된 정책을 회복 불가능한 수준으로 손상시킬 수 있었다.18 이는 대규모 비선형 정책 함수를 다루는 데 있어 큰 걸림돌이었다.9
2.2.1 핵심 개념 및 방법론 분석
Schulman 등이 발표한 “Trust Region Policy Optimization” 9은 이러한 불안정성 문제를 해결하기 위해 ’신뢰 영역(trust region)’이라는 개념을 도입했다. TRPO의 핵심 아이디어는 정책을 업데이트할 때, 새로운 정책이 이전 정책으로부터 너무 멀리 벗어나지 않도록 제한을 가함으로써 매 업데이트 단계에서 성능이 단조롭게(monotonically) 향상됨을 이론적으로 보장하는 것이다.9
TRPO는 보상 기댓값인 목적 함수 \eta(\pi)를 직접 최적화하는 대신, 현재 정책 \pi_{old} 주변에서 목적 함수의 성능 향상을 근사하는 대리 목적 함수(surrogate objective function) L_{\pi_{old}}(\pi)를 최적화한다. Kakade와 Langford의 연구에 기반하여, 새로운 정책 \tilde{\pi}의 성능은 다음과 같이 표현될 수 있다.9
\eta(\tilde{\pi}) = \eta(\pi) + \sum_{s} \rho_{\tilde{\pi}}(s) \sum_{a} \tilde{\pi}(a|s) A_{\pi}(s, a)
여기서 A_{\pi}(s, a)는 정책 \pi 하에서의 어드밴티지 함수(advantage function)이며, \rho_{\tilde{\pi}}(s)는 정책 \tilde{\pi}를 따를 때의 상태 방문 빈도이다. 이 식은 새로운 정책의 성능을 평가하기 위해 새로운 정책으로부터 샘플을 수집해야 하므로 직접 사용하기 어렵다. TRPO는 상태 방문 빈도를 현재 정책 \pi_{old}의 것으로 근사하여 다음과 같은 대리 목적 함수를 정의한다.
L_{\pi_{old}}(\pi) = \eta(\pi_{old}) + \sum_{s} \rho_{\pi_{old}}(s) \sum_{a} \pi(a|s) A_{\pi_{old}}(s, a)
이 대리 목적 함수를 최대화하되, 근사의 유효성을 보장하기 위해 새로운 정책 \pi와 이전 정책 \pi_{old} 사이의 차이가 특정 크기 \delta를 넘지 않도록 제약 조건을 부과한다. 이 차이는 평균 쿨백-라이블러 발산(KL divergence)으로 측정된다.
\max_{\pi} L_{\pi_{old}}(\pi) \quad \text{subject to} \quad \bar{D}_{KL}(\pi || \pi_{old}) \le \delta
이 제약 조건이 있는 최적화 문제를 통해, TRPO는 이론적으로 성능의 단조로운 향상을 보장하는 하한(lower bound)을 가진다. 즉, η(\pi_{i+1}) - η(\pi_i) \ge 0이 보장되는 방향으로 정책을 업데이트할 수 있다.9 실제 구현에서는 이 문제를 효율적으로 풀기 위해 목적 함수를 2차 근사하고 제약 조건을 1차 근사한 뒤, 공액 경사법(conjugate gradient method)을 사용하여 탐색 방향을 구하고, 이후 라인 서치(line search)를 통해 실제 성능 향상을 보장하는 단계 크기를 결정한다.
2.2.2 기술적 의의 및 장기적 영향
TRPO는 심층 강화학습 알고리즘에 이론적 안정성을 부여한 기념비적인 연구로 평가받는다. 정책 업데이트의 안정성을 보장함으로써, 로봇의 보행, 수영, 뛰기 등 복잡한 연속 제어 문제와 아타리 게임과 같은 고차원 입력 문제에서 이전 방법들보다 훨씬 안정적이고 강력한 성능을 보여주었다.9
그러나 TRPO는 2차 근사를 사용하고 공액 경사법을 통해 복잡한 최적화 문제를 풀어야 했기 때문에 구현이 복잡하고 계산 비용이 높다는 단점이 있었다. 이러한 실용적인 문제에도 불구하고, TRPO가 제시한 ’신뢰 영역 내에서 정책을 보수적으로 업데이트한다’는 핵심 철학은 강화학습 커뮤니티에 깊은 영향을 미쳤다. 이 아이디어는 이후 OpenAI에 의해 개발된 Proximal Policy Optimization (PPO) 알고리즘으로 직접 계승되었다.22 PPO는 TRPO의 엄격한 제약 조건을 클리핑(clipping)이라는 더 간단한 형태로 근사하여, 구현이 훨씬 쉬우면서도 TRPO에 필적하는 안정성과 성능을 달성했다.19 그 결과, PPO는 현재 심층 강화학습 분야에서 가장 널리 사용되는 표준 알고리즘 중 하나로 자리 잡았으며, 이는 TRPO가 제시한 ‘신뢰 영역’ 개념의 근본적인 중요성과 영향력을 명확히 방증한다.
2.3 딥러닝 훈련 패러다임의 혁신: 배치 정규화 (Batch Normalization)
2015년경 딥러닝 연구자들은 신경망의 층을 깊게 쌓을수록 성능이 향상된다는 것을 경험적으로 알고 있었지만, 실제로 매우 깊은 네트워크를 훈련시키는 것은 극도로 어려운 과제였다. 훈련 과정에서 이전 층의 가중치가 업데이트됨에 따라 각 층의 입력값(활성화) 분포가 계속해서 변하는 현상, 즉 **내부 공변량 변화(Internal Covariate Shift, ICS)**가 주요 원인으로 지목되었다.8 이로 인해 학습률을 매우 낮게 설정해야 했고, 가중치 초기화에 극도로 민감해져 훈련 과정이 불안정하고 수렴 속도가 매우 느렸다.24
2.3.1 핵심 개념 및 방법론 분석
Sergey Ioffe와 Christian Szegedy가 발표한 “Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift” 8는 이 문제를 해결하기 위한 간단하면서도 매우 효과적인 해법을 제시했다. 배치 정규화의 핵심 아이디어는 신경망의 각 층에 들어오는 입력 데이터의 분포를 훈련 과정 내내 안정적으로 유지하는 것이다. 이는 미니배치(mini-batch) 단위로 각 특성(feature)에 대해 평균과 분산을 계산한 뒤, 이를 이용해 입력을 정규화(normalize)함으로써 달성된다.8
구체적으로, d-차원 입력 x = (x^{(1)},..., x^{(d)})에 대해 각 차원 x^{(k)}는 다음과 같이 정규화된다.
\hat{x}^{(k)} = \frac{x^{(k)} - \mathrm{E}[x^{(k)}]}{\sqrt{\mathrm{Var}[x^{(k)}] + \epsilon}}
여기서 기댓값 \mathrm{E}[x^{(k)}]와 분산 \mathrm{Var}[x^{(k)}]은 현재 처리 중인 미니배치에 속한 샘플들에 대해 계산된다. \epsilon은 수치적 안정을 위한 작은 상수이다. 이 과정은 각 층의 입력 분포를 평균 0, 분산 1로 강제하여 ICS를 줄인다.
그러나 단순히 정규화만 수행하면 시그모이드(sigmoid)와 같은 비선형 함수의 표현력이 제한될 수 있다. 예를 들어, 입력이 항상 정규분포의 선형 영역에만 머무르게 될 수 있다. 이를 방지하고 모델의 표현력을 복원하기 위해, 배치 정규화는 학습 가능한 파라미터인 스케일(\gamma^{(k)})과 시프트(\beta^{(k)})를 도입하여 정규화된 값에 선형 변환을 적용한다.8
y^{(k)} = \gamma^{(k)}\hat{x}^{(k)} + \beta^{(k)}
이 파라미터들(\gamma와 \beta)은 역전파(backpropagation)를 통해 다른 모델 파라미터와 함께 학습된다. 만약 네트워크가 \gamma^{(k)} = \sqrt{\mathrm{Var}[x^{(k)}]}와 \beta^{(k)} = \mathrm{E}[x^{(k)}]를 학습하게 되면, 배치 정규화 변환은 항등 변환(identity transform)을 복원할 수 있으므로, 네트워크의 표현력 손실이 없다. 이 전체 과정은 미분 가능한 연산으로 구성되어 신경망에 하나의 새로운 층(Batch Norm Layer)으로 쉽게 통합될 수 있다.
2.3.2 기술적 의의 및 영향
배치 정규화의 등장은 딥러닝 훈련 방식에 혁명을 일으켰다. 이 기술의 도입으로 다음과 같은 막대한 이점들이 확인되었다.
-
훈련 속도 가속: ICS를 줄임으로써 훨씬 높은 학습률을 사용할 수 있게 되어, 훈련 수렴 속도가 획기적으로 빨라졌다. 원 논문에서는 동일한 정확도를 달성하는 데 필요한 훈련 단계가 14배나 줄어들었다고 보고했다.8
-
안정성 향상: 훈련이 가중치 초기값에 덜 민감해졌으며, 경사 소실/폭주(vanishing/exploding gradients) 문제를 완화하여 전체적인 훈련 과정이 매우 안정되었다.24
-
규제 효과: 미니배치 통계량에 의해 발생하는 미세한 노이즈가 일종의 규제(regularization) 역할을 하여, 모델의 일반화 성능을 향상시키고 드롭아웃(Dropout)과 같은 다른 규제 기법의 필요성을 줄여주었다.23
-
초심층 네트워크 구현 가능: 배치 정규화가 제공하는 안정성 덕분에 이전에는 훈련이 거의 불가능했던 수십, 수백 개 이상의 층을 가진 매우 깊은 신경망의 훈련이 가능해졌다. 이는 이후 2015년 말에 등장한 ResNet(Residual Network)과 같은 혁신적인 아키텍처의 성공에 결정적인 기술적 기반이 되었다.26
이러한 강력한 이점들로 인해 배치 정규화는 발표 직후부터 딥러닝, 특히 컴퓨터 비전 분야의 컨볼루션 신경망(CNN)에서 거의 모든 아키텍처에 채택되는 표준 구성 요소로 자리 잡았다. 비록 배치 정규화의 정확한 작동 원리에 대해서는 ‘ICS 감소’ 가설 외에 ‘최적화 지형 평탄화(smoothing the optimization landscape)’ 24 등 후속 연구들을 통해 다양한 해석이 제시되었지만, 그 실용적 효과는 의심의 여지가 없었다.
ICML 2015에서 발표된 TRPO와 배치 정규화는 공통적으로 기존 모델의 근본적인 불안정성과 비효율성 문제를 해결하는 데 집중했다는 특징을 가진다. 이는 당시 딥러닝 분야가 새로운 모델 구조를 탐색하는 단계를 넘어, 기존 기술을 신뢰성 있고 확장 가능하게 만드는 공학적 성숙 단계로 진입하고 있었음을 보여준다. TRPO가 강화학습의 불안정성을 제어하는 원칙을 제시했다면, 배치 정규화는 심층 지도학습의 훈련 과정 자체를 안정화시키는 강력한 도구를 제공했다. 이 두 연구는 단순히 “AI를 만들 수 있는가?“라는 질문에서 “AI를 잘, 그리고 반복적으로 만들 수 있는가?“라는 질문으로 연구의 초점이 이동하고 있음을 알리는 중요한 이정표였다.
3. 로보틱스: 과학 및 시스템 (RSS 2015): 자율 시스템의 정교화
3.1 개요
2015년 7월 13일부터 17일까지 이탈리아 로마의 사피엔차 대학교에서 개최된 제11회 Robotics: Science and Systems (RSS 2015)는 로봇 공학의 알고리즘 및 수학적 기초에 중점을 두는 최상위 학회로서, 이 분야의 이론적 진보를 선도하는 역할을 한다.5 RSS는 단일 트랙으로 진행되어 모든 참석자가 로봇 공학의 전 분야에 걸친 최고 수준의 연구를 접할 수 있는 기회를 제공한다.29 2015년 학회에서는 총 188편의 논문이 제출되어 그 중 49편만이 채택되는 매우 높은 경쟁률(채택률 26.1%)을 기록했으며, 이는 연구의 질적 수준을 엄격하게 관리하고 있음을 보여준다.5 이 해에는 특히 불확실성이 존재하는 실제 환경에서 로봇의 상태를 정밀하게 추정하고, 인간과 지능적으로 상호작용하는 문제에 대한 수학적으로 정교하고 원칙적인 접근법들이 제시되어 큰 주목을 받았다.
3.2 고정밀 로봇 항법 기술: 다양체 기반 IMU 사전 통합 (IMU Preintegration on Manifold for Efficient Visual-Inertial Maximum-a-Posteriori Estimation)
로봇이 자율적으로 이동하기 위해서는 자신의 위치와 자세를 정확하게 아는 것이 필수적이다. 이를 위해 저렴하고 상호 보완적인 카메라와 관성 측정 장치(IMU)를 융합하는 시각-관성 주행 거리 측정(Visual-Inertial Odometry, VIO) 기술이 널리 연구되어 왔다.30 특히, 과거의 모든 측정치를 재선형화하여 전역 최적해를 구하는 최적화 기반(optimization-based) 접근법은 필터링 기반(filtering-based) 방법보다 높은 정확도를 보였다.32 그러나 이 접근법은 심각한 계산 복잡성 문제를 안고 있었다. IMU는 수백 Hz의 높은 주기로 데이터를 출력하는데, 이 모든 측정치를 최적화 문제의 변수로 포함시키면 계산량이 실시간 처리가 불가능할 정도로 폭발적으로 증가하기 때문이다.30
3.2.1 핵심 개념 및 방법론 분석
Christian Forster 등이 발표한 “IMU Preintegration on Manifold for Efficient Visual-Inertial Maximum-a-Posteriori Estimation” 30은 이 문제를 해결하기 위해 ’IMU 사전 통합(IMU Preintegration)’이라는 혁신적인 기법을 제안했다. 핵심 아이디어는 두 개의 연속된 이미지 키프레임(keyframe) 사이에서 발생한 수백 개의 IMU 측정치를 단일 상대 운동 제약 조건(single relative motion constraint)으로 미리 요약(summarize)하는 것이다.30
이 연구의 가장 중요한 기여는 회전(rotation)을 표현하고 불확실성을 전파하는 방식에 있다. 이전의 연구들은 회전을 표현하기 위해 오일러 각(Euler angles)을 사용하는 경우가 많았는데, 이는 짐벌 락(gimbal lock)과 같은 특이점(singularity) 문제를 가지며, 유클리드 공간에서의 평균 및 공분산 계산을 기하학적으로 올바르지 않은 방식으로 적용하는 한계가 있었다.32 이 논문은 이러한 문제를 근본적으로 해결하기 위해 회전 그룹의 올바른 기하학적 구조인
3차원 특수 직교 그룹 다양체(SO(3) manifold) 상에서 직접 사전 통합을 수행하는 이론을 정립했다.30
이 접근법에 따르면, 회전의 불확실성은 다양체 위에서의 분포로 모델링되며, 작은 섭동(perturbation)은 다양체의 접 공간(tangent space)에서 다루어진다. 이를 통해 모든 자코비안(Jacobian)을 해석적으로(analytically) 유도할 수 있어 정확성과 효율성을 모두 확보했다. 또한, 사전 통합 계산이 특정 전역 좌표계가 아닌 두 키프레임 사이의 상대적인 로컬 좌표계에서 수행되도록 설계되었다. 이 덕분에 최적화 과정에서 이전 키프레임의 자세 추정치가 업데이트(즉, 선형화 지점이 변경)되더라도, 매번 IMU 측정치를 재통합할 필요 없이 간단한 보정만으로 사전 통합된 제약 조건을 재사용할 수 있어 계산 효율성이 극대화되었다.30
3.2.2 기술적 의의 및 장기적 영향
이 연구는 현대 VIO 및 SLAM(Simultaneous Localization and Mapping) 시스템의 이론적 기틀을 마련한 기념비적인 성과로 평가받는다. SO(3) 다양체 위에서 운동과 불확실성을 다루는 이 원칙적인 접근법은 이후 VINS-Mono, OKVIS, ORB-SLAM3 등 수많은 고성능 오픈소스 VIO 시스템에 핵심 이론으로 채택되었다. 이는 로봇이 자신의 위치와 자세를 실시간으로, 그리고 매우 정확하게 추정하는 능력을 한 단계 끌어올리는 결정적인 계기가 되었다. 이 기술의 발전은 증강/가상현실(AR/VR) 기기의 정밀한 트래킹, 드론의 자율 비행, 그리고 자율주행차의 안정적인 위치 추정 등 다양한 첨단 기술 분야의 발전에 크게 기여했다. 연구팀은 이 방법론을 GTSAM 4.0이라는 최적화 라이브러리에 구현하여 공개함으로써 학계와 산업계 전반에 그 영향력을 더욱 확산시켰다.30
3.3 인간-로봇 협업의 지능화: 후견 최적화를 통한 공유 자율성 (Shared Autonomy via Hindsight Optimization)
인간과 로봇이 협력하여 작업을 수행하는 공유 자율성(Shared Autonomy)은 로봇 원격 조작이나 보조 시스템의 핵심 패러다임이다.35 이 패러다임의 가장 큰 난제는 로봇이 사용자의 의도나 최종 목표를 명확히 알지 못하는 불확실성 상황에서 어떻게 효과적으로 사용자를 보조할 수 있는가이다.36 기존의 많은 접근법들은 사용자의 목표를 하나로 예측한 뒤, 그 예측된 목표를 기준으로 로봇의 보조 행동을 결정하는 ‘예측-후-혼합(predict-then-blend)’ 방식을 사용했다. 그러나 이러한 방식은 사용자의 의도가 모호하거나 여러 가능성이 존재할 때, 잘못된 예측으로 인해 오히려 작업 수행을 방해하는 ‘나쁜’ 보조를 제공할 위험이 있었다.35
3.3.1 핵심 개념 및 방법론 분석
Shervin Javdani 등이 발표한 “Shared Autonomy via Hindsight Optimization” 33은 이 문제를 보다 근본적이고 원칙적인 방식으로 해결하고자 했다. 연구팀은 공유 자율성 문제를 ’사용자의 목표에 대한 불확실성을 가진 부분 관측 가능 마르코프 결정 과정(Partially Observable Markov Decision Process, POMDP)’으로 공식화했다.35 이 프레임워크에서 로봇의 상태는 물리적 상태뿐만 아니라, 사용자의 가능한 목표들에 대한 확률 분포, 즉 ’믿음 상태(belief state)’를 포함한다.
로봇은 사용자의 조작 입력 이력(history of inputs)을 관찰하여, 최대 엔트로피 역 최적 제어(Maximum Entropy Inverse Optimal Control, MaxEnt IOC) 기법을 통해 사용자가 어떤 목표를 가질지에 대한 확률 분포를 실시간으로 추정하고 업데이트한다.35 이 연구의 핵심적인 기여는 단일 목표를 가정하지 않고, 추정된 목표 분포 전체를 고려하여 로봇의 최적 보조 행동을 결정한다는 점이다. 즉, 로봇은 모든 가능한 목표에 대한 기대 비용(expected cost-to-go)을 최소화하는 행동을 선택한다.
이 POMDP를 정확하게 푸는 것은 계산적으로 매우 복잡하여 실시간 적용이 어렵다(intractable).36 따라서 연구팀은 **후견 최적화(Hindsight Optimization)**라는 효율적인 근사 기법을 사용했다. 이는 각 가능한 목표
g에 대해, 만약 그 목표가 진짜 목표였다면 최적이었을 행동을 계산한 뒤, 이 행동들의 기댓값을 현재의 목표 분포에 따라 가중 평균하여 최종 행동을 결정하는 방식과 유사하다. 이 접근법은 사용자의 의도가 모호할 때(예: 두 목표 지점의 중간에 있을 때), 어느 한쪽으로 섣불리 치우치지 않고 양쪽 모두에 합리적인, 혹은 사용자의 현재 조작을 방해하지 않는 중립적인 보조를 제공할 수 있게 한다.35
3.3.2 기술적 의의 및 장기적 영향
이 연구는 불확실한 사용자 의도를 다루는 방식을 단순한 분류/예측 문제에서 원칙적인 결정 이론(decision-theoretic) 문제로 격상시켰다는 점에서 중요한 의의를 가진다. 목표 분포를 직접 활용하는 이 프레임워크는 보조 로봇, 지능형 휠체어, 반자율 주행차와 같은 인간-기계 협력 시스템에서 보다 안전하고, 효율적이며, 사용자의 의도를 존중하는 지능적인 상호작용을 설계하는 데 중요한 이론적 기반을 제공했다. 사용자 연구를 통해 이 방법이 기존의 ‘예측-후-혼합’ 방식보다 사용자가 더 적은 입력으로 더 빠르게 작업을 완료하도록 돕는다는 것을 실험적으로 입증했다.36 이는 불확실성을 명시적으로 모델링하고 이에 기반해 최적의 결정을 내리는 것이 HRI 시스템의 성능을 실질적으로 향상시킬 수 있음을 보여준 대표적인 사례이다.
RSS 2015에서 발표된 이 두 주요 연구는 로봇 공학 분야가 휴리스틱 기반의 해결책에서 벗어나, 불확실성을 다루기 위한 보다 형식적이고 수학적으로 엄밀한 프레임워크로 나아가고 있음을 명확히 보여준다. IMU 사전 통합 연구는 센서 융합 문제를 해결하기 위해 리 군 이론(Lie group theory)이라는 수학적 구조를 도입했으며, 공유 자율성 연구는 인간-로봇 상호작용 문제를 해결하기 위해 POMDP라는 확률적 결정 이론을 적용했다. 이는 로봇 공학 분야가 이론적 성숙도와 계산 능력의 발전에 힘입어, 더 복잡하지만 더 강건한 방법론들을 실시간 문제에 적용하기 시작했음을 의미한다. 이러한 경향은 지저분하고 불확실한 실제 세계에서 강건한 자율성을 달성하기 위해서는 교묘한 기법뿐만 아니라 확률, 최적화, 기하학에 대한 깊은 이해가 필수적이라는 인식이 확산되었음을 보여준다.
4. 제24회 국제 인공지능 공동 학회 (IJCAI 2015): AI 이론의 확장
4.1 개요
2015년 7월 25일부터 31일까지 남미 최초로 아르헨티나 부에노스아이레스에서 개최된 제24회 국제 인공지능 공동 학회(IJCAI 2015)는 AI의 모든 하위 분야를 망라하는 최고 권위의 학회이다.6 “인공지능과 예술(Artificial Intelligence and Arts)“이라는 주제 아래 개최된 이 학회는 역대 최대 규모인 1,996편의 논문이 제출되어, 엄격한 심사를 거쳐 572편이 채택되었다 (채택률 28.6%).42 2015년은 딥러닝이 AI 연구의 주류로 부상하던 시기였음에도 불구하고, IJCAI 2015는 인과관계 추론, 비볼록 최적화, 제약 만족 문제 등 AI의 근본적인 이론적 문제에 대한 깊이 있는 연구 성과들을 조명하며 AI 연구의 폭넓은 스펙트럼을 유지했다. 이는 딥러닝의 경험적 성공을 넘어서, AI의 설명가능성과 추론 능력, 그리고 문제 해결의 효율성을 이론적으로 탐구하려는 노력이 여전히 AI 연구의 중요한 축임을 보여주었다.
4.2 인과관계 추론의 재정의: Halpern-Pearl 정의의 수정 (A Modification of the Halpern-Pearl Definition of Causality)
인간 지능의 핵심 요소 중 하나는 상관관계를 넘어 인과관계를 추론하는 능력이다. AI 시스템이 진정으로 지능적으로 행동하고 인간과 상호작용하기 위해서는 “왜” 특정 결과가 발생했는지 설명할 수 있는 능력이 필수적이다. Judea Pearl과 Joseph Halpern이 제안한 구조 방정식 모델 기반의 실제 인과성(Actual Causality) 정의, 즉 HP 정의는 이러한 인과 추론을 형식화하려는 시도 중 가장 영향력 있는 것 중 하나였다.43 그러나 기존의 HP 정의는 직관에 반하는 결과를 내는 여러 예외적인 사례(counter-intuitive examples)가 존재했으며, 정의 자체가 여러 조건으로 복잡하게 구성되어 있다는 비판을 받아왔다.43
4.2.1 핵심 개념 및 방법론 분석
Joseph Halpern이 발표한 “A Modification of the Halpern-Pearl Definition of Causality” 39는 기존 HP 정의의 복잡성과 문제점들을 해결하기 위한 새로운 수정안을 제시했다. 실제 인과성을 판단하는 HP 정의의 핵심은 반사실적 사고(counterfactual reasoning)에 있다. 즉, “만약 A가 일어나지 않았다면, B도 일어나지 않았을 것인가?“라는 질문을 통해 A가 B의 원인인지를 판단한다. 기존 정의에서는 이 반사실적 시나리오를 구성할 때, 잠재적 원인(putative cause) 외에 다른 변수들의 값을 임의로 변경하는 것을 허용하여 복잡한 상황을 만들어냈다.
이 논문에서 제안된 수정안의 핵심은 이러한 반사실적 시나리오에 가해지는 제약을 대폭 단순화하고 강화한 것이다.43 새로운 정의에서는 잠재적 원인이 되는 변수
X의 값을 반사실적으로 바꿀 때, 그 외의 다른 변수 \vec{W}의 값은 임의로 바꾸는 것을 허용하지 않는다. 대신, \vec{W}의 변수들을 그들의 ’실제 값으로 고정(frozen)’시키는 것만을 허용한다.43 이 간단하지만 강력한 제약은 고려해야 할 반사실적 세계의 수를 크게 줄여준다. 이로 인해 인과성의 정의 자체가 훨씬 간결해지며, 기존 정의에서 문제가 되었던 조기 선점(early preemption)이나 대칭적 과잉결정(symmetric overdetermination)과 같은 여러 까다로운 예제들을 더 직관적이고 만족스럽게 해결할 수 있게 된다.
4.2.2 기술적 의의 및 장기적 영향
이 연구는 설명가능 AI(Explainable AI, XAI)와 인과 추론 분야의 이론적 발전에 중요한 기여를 했다. 수정된 정의는 개념적으로 더 단순하고 직관적일 뿐만 아니라, 인과성을 판별하는 데 필요한 계산 복잡도 또한 기존의 \Sigma_2^P에서 \Delta_2^P로 낮아져 이론적으로 더 다루기 쉬워졌다.43 AI 시스템이 단순히 예측 결과를 내놓는 것을 넘어, 자신의 결정에 대한 인과적 설명을 생성하고, 특정 개입(intervention)의 결과를 예측하는 능력은 신뢰할 수 있는 AI를 구축하는 데 필수적이다. Halpern의 이 연구는 이러한 능력을 뒷받침하는 형식적 기반을 더욱 견고하고 명료하게 다듬었다는 점에서 큰 의의를 가진다. 이는 이후 AI의 공정성, 책임성, 투명성(Fairness, Accountability, and Transparency, FAT)에 대한 논의가 활발해지는 데 이론적 자양분을 제공했다.
4.3 비볼록 최적화 문제의 해법: 재귀적 분해 기법 (Recursive Decomposition for Nonconvex Optimization)
인공지능의 수많은 문제들은 본질적으로 최적화 문제로 귀결된다. 특히, 딥러닝 모델의 훈련, 제약 만족 문제(Constraint Satisfaction Problems, CSP), 확률적 추론(probabilistic inference) 등 많은 실제 AI 문제들은 목적 함수가 여러 개의 지역 최적점(local optima)을 가지는 비볼록 최적화(nonconvex optimization) 문제에 해당한다. 이러한 문제들은 전역 최적해(global optimum)를 찾는 것이 매우 어렵다는 특징을 가진다.
4.3.1 IJCAI-15 최우수 논문(Distinguished Paper) 분석
Abram L. Friesen과 Pedro Domingos가 발표하여 IJCAI-15 최우수 논문으로 선정된 “Recursive Decomposition for Nonconvex Optimization” 39은 이러한 어려운 비볼록 최적화 문제를 효율적으로 풀기 위한 새로운 프레임워크를 제시했다.
4.3.2 핵심 개념 및 방법론
이 연구의 핵심 아이디어는 문제에 내재된 구조(structure)를 활용하는 ‘분할 정복(divide-and-conquer)’ 접근법에 있다. 많은 최적화 문제에서 전체 변수 집합은 서로 약하게 상호작용하는 하위 집합들로 나뉠 수 있다. 이 논문은 이러한 문제의 구조를 트리 형태로 표현하고, 전체 문제를 더 작은 하위 문제들로 **재귀적으로 분해(recursive decomposition)**한다. 분해된 각 하위 문제는 독립적으로 또는 제한된 상호작용 하에서 풀 수 있으며, 이렇게 얻어진 하위 문제들의 해를 다시 체계적으로 결합하여 전체 문제의 해를 구성한다. 이 방법은 특히 문제의 상호작용 구조가 낮은 트리 폭(treewidth)을 가질 때, 즉 문제의 구조가 트리와 유사할수록 지수적으로 더 효율적이게 된다.
4.3.3 기술적 의의 및 장기적 영향
이 연구는 특정 유형의 비볼록 최적화 문제에 대해 전역 최적해를 보장하면서도 실용적인 시간 내에 해를 찾을 수 있는 강력하고 일반적인 방법론을 제공했다는 점에서 높은 평가를 받았다. 제약 만족, 베이즈 네트워크에서의 추론, 마르코프 논리 네트워크(Markov Logic Networks) 등 다양한 AI 분야의 핵심적인 문제들은 종종 이러한 구조적 특성을 보인다. 따라서 이 재귀적 분해 기법은 해당 분야의 대규모 최적화 문제를 다루는 알고리즘들의 성능과 확장성을 향상시키는 데 직접적으로 기여할 수 있는 잠재력을 보여주었다. 이는 딥러닝과 같은 데이터 기반 접근법뿐만 아니라, 기호적 추론 및 구조적 모델링에 기반한 고전적인 AI 연구 분야의 중요성과 발전 가능성을 다시 한번 확인시켜 준 성과였다.
5. IEEE/RSJ 지능형 로봇 및 시스템 국제 학회 (IROS 2015): 실제 환경과의 상호작용
5.1 개요
2015년 9월 28일부터 10월 2일까지 독일 함부르크에서 개최된 IEEE/RSJ 지능형 로봇 및 시스템 국제 학회(IROS 2015)는 로봇 공학 및 지능형 시스템 분야에서 세계 최대 규모와 영향력을 자랑하는 학회 중 하나이다.7 “로봇 시대로의 관문(Gateway to the Era of Robots)“이라는 주제 아래 2,500명 이상의 연구자, 개발자, 산업계 인사가 참석했으며, 이는 당시 로봇 기술에 대한 높은 기대를 반영한다.44 IROS는 이론적 연구뿐만 아니라 실제 환경에서 작동하는 로봇 시스템과 그 응용 기술에 대한 연구 발표가 주를 이루는 것이 특징이다. 2015년 학회에서는 특히 로봇이 동적인 실제 환경을 인식하고, 인간과 자연스럽게 상호작용하기 위한 구체적이고 실용적인 기술들이 다수 발표되었다.
5.2 전방위 비전 기반 SLAM: 대규모 직접 SLAM 기술 (Large-Scale Direct SLAM for Omnidirectional Cameras)
로봇이 미지의 환경에서 자신의 위치를 추정하고 동시에 지도를 작성하는 SLAM(Simultaneous Localization and Mapping) 기술은 자율 이동 로봇의 핵심 기능이다. 2015년경 SLAM 기술은 특징점(keypoint) 기반의 간접(indirect) 방식과 이미지의 픽셀 밝기 값을 직접 사용하는 직접(direct) 방식으로 나뉘어 발전하고 있었다. 특히 직접 SLAM 방식은 특징점이 부족한 텍스처가 적은 환경에서도 강건하게 작동할 수 있다는 장점으로 주목받고 있었다.47
5.2.1 핵심 개념 및 방법론 분석
David Caruso 등이 발표한 “Large-Scale Direct SLAM for Omnidirectional Cameras” 44는 당시 선구적인 직접 SLAM 기술이었던 LSD-SLAM(Large-Scale Direct Monocular SLAM) 47을 360도의 넓은 시야각을 제공하는
전방위(omnidirectional) 카메라에 적용하고 확장한 연구이다.
전방위 카메라는 한 번에 주변 환경 전체를 볼 수 있어 로봇의 빠른 회전 움직임에도 강건하게 추적을 유지할 수 있다는 큰 장점을 가진다.51 하지만 어안 렌즈(fisheye lens)나 반사 거울을 사용하기 때문에 이미지 왜곡이 매우 심하다는 단점이 있다. 기존의 많은 접근법은 이 왜곡된 이미지를 먼저 평면 이미지로 변환한 후 처리했는데, 이 과정에서 정보 손실이 발생하고 계산 비용이 추가되는 문제가 있었다. 이 연구의 핵심 기여는 왜곡된 이미지를 보정하는 대신, **통합된 전방위 카메라 모델(unified omnidirectional camera model)**을 직접 SLAM의 최적화 과정에 통합한 것이다.48 즉, 픽셀의 밝기 오차(photometric error)를 최소화하는 과정에서 카메라의 왜곡 모델을 직접 고려하여 카메라의 자세(pose)를 추정한다. 이를 통해 정보 손실 없이 전방위 카메라의 넓은 시야각이라는 장점을 최대한 활용하면서, LSD-SLAM이 가진 대규모 환경에서의 강건한 지도 작성 및 위치 추정 능력을 유지할 수 있었다.
5.2.2 기술적 의의 및 장기적 영향
이 연구는 SLAM 기술의 센서 적용 범위를 성공적으로 확장시켰다. 전방위 카메라를 직접 SLAM 프레임워크에 통합함으로써, 로봇은 한 번에 더 넓은 환경 정보를 얻고, 더 빠르고 급격한 움직임에도 위치를 잃지 않는 강건성을 확보하게 되었다. 이는 특히 좁은 공간을 빠르게 움직여야 하는 드론이나, 주변 환경을 지속적으로 감시해야 하는 감시 로봇, 그리고 복잡한 도심 환경을 주행하는 자율주행차의 항법 성능을 향상시키는 데 중요한 기여를 했다. 이 연구는 다양한 종류의 카메라 모델을 SLAM 시스템에 유연하게 통합하는 연구 흐름을 가속화시키는 계기가 되었다.
5.3 인간 중심 로봇 서비스 설계: 정보 수집 로봇 (Designing Information Gathering Robots for Human-Populated Environments)
로봇 기술이 발전함에 따라, 로봇의 역할은 공장의 정형화된 작업을 넘어 인간이 생활하는 일상 공간으로 확장되고 있었다. 이러한 환경에서 로봇이 성공적으로 도입되기 위해서는 단순히 기술적으로 뛰어난 성능을 보이는 것을 넘어, 실제 사용자의 요구를 충족시키고 유용한 가치를 제공해야 한다.
5.3.1 핵심 개념 및 방법론 분석
Michael Jae-Yoon Chung 등이 발표한 “Designing Information Gathering Robots for Human-Populated Environments” 52는 기술 개발에 앞서 사용자 중심의 요구사항 분석이 얼마나 중요한지를 보여주는 대표적인 인간-로봇 상호작용(HRI) 연구이다. 이 연구는 자율 이동 로봇이 배달이나 안내와 같은 주된 임무 외에, 동적으로 변화하는 인간의 환경에서 사용자를 위한 **‘정보 수집 에이전트(InfoBot)’**로서 어떤 역할을 할 수 있는지를 탐구했다.52
연구팀은 최첨단 알고리즘을 개발하는 대신, 실제 사무실 환경에서 두 가지 사용자 연구를 수행했다.52 첫째, 설문조사를 통해 잠재적 사용자들에게 “만약 사무실에 로봇이 있다면, 어떤 정보를 물어보고 싶은가?“를 질문하여 요구사항을 수집했다. 둘째, 4일 동안 실제 로봇을 배치하고, 사용자들이 웹 인터페이스를 통해 자연어로 질문을 하면 연구자가 원격으로 로봇을 조종하여 답을 찾아주는 ‘위저드 오브 오즈(Wizard-of-Oz)’ 실험을 진행했다. 이 실험을 통해 사용자들의 실제 질문 유형과 상호작용 패턴을 관찰했다.
이러한 사용자 연구를 통해, 연구팀은 정보 수집 작업을 다음과 같은 네 가지 유형으로 체계적으로 분류했다 53:
-
확인(Checking): 특정 장소의 특정 상태를 확인하는 작업 (예: “회의실에 사람이 있나요?”)
-
탐색(Searching): 특정 대상이 발견될 때까지 여러 장소를 찾는 작업 (예: “내 커피잔이 어디에 있나요?”)
-
감시(Monitoring): 특정 장소에서 특정 사건이 발생할 때까지 기다리는 작업 (예: “택배가 도착하면 알려주세요.”)
-
요약(Summarizing): 이동 중에 수집된 정보를 종합하여 보고하는 작업 (예: “오늘 사무실에 새로 온 방문객이 있었나요?”)
5.3.2 기술적 의의 및 장기적 영향
이 연구는 기술 중심적 사고에서 벗어나, 로봇이 실제 환경에서 인간에게 어떤 가치를 제공할 수 있는지를 사용자로부터 직접 탐구했다는 점에서 HRI 분야에 중요한 방법론적 시사점을 제공했다. ’InfoBot’이라는 구체적인 개념과 네 가지 작업 유형 분류는 이후 사무실, 병원, 가정 등 다양한 환경에서 로봇이 수행할 수 있는 지능형 서비스의 프로토타입을 제시하고, 관련 기술 개발의 방향성을 설정하는 데 기여했다. 이는 로봇 공학 연구가 단순히 ’가능한 것’을 만드는 것을 넘어, ’필요하고 유용한 것’을 만들기 위해 사용자 중심 설계(User-Centered Design) 원칙을 적극적으로 수용해야 함을 보여준 상징적인 사례로 평가된다.
6. 주요 산업 연구소 동향 및 전망
2015년 3분기는 학계의 이론적 진보와 더불어, 주요 산업 연구소들이 AI 기술을 현실 세계의 복잡한 문제에 적용하고, 그 과정에서 발생하는 기술적, 사회적 과제들을 해결하려는 노력을 본격화한 시기였다. Google DeepMind, Google Brain, Facebook AI Research (FAIR) 등은 이 시기 AI 연구의 방향을 주도하며 학계와 산업계 모두에 큰 영향을 미쳤다.
6.1 딥마인드(DeepMind)와 NHS 파트너십: AI 헬스케어 적용의 서막
2015년 9월, Google에 인수된 영국의 AI 연구소 딥마인드는 영국 국민보건서비스(NHS) 산하의 로열 프리 런던 NHS 재단과 중대한 파트너십을 체결했다.11 이 협력의 공식적인 목표는 급성 신장 손상(Acute Kidney Injury, AKI) 환자를 조기에 발견하고 관리하는 모바일 앱 ’스트림스(Streams)’를 공동 개발하는 것이었다.13 이는 딥마인드가 보유한 최첨단 AI 기술을 인류의 건강 증진이라는 매우 의미 있는 목표에 적용하려는 첫 대규모 시도였다.
이 파트너십은 AI가 실제 임상 환경에서 의료진을 도와 환자의 생명을 구하는 데 기여할 수 있다는 엄청난 긍정적 기대를 불러일으켰다.12 그러나 이 프로젝트는 곧 심각한 사회적, 윤리적 논쟁의 중심에 서게 되었다. 파트너십의 일환으로 약 160만 명에 달하는 환자의 과거 의료 기록이, 환자 개개인의 명시적인 동의 없이 딥마인드에 제공되었다는 사실이 알려지면서부터였다.12 이 데이터에는 HIV 검사 결과, 약물 과다복용, 임신 중절 기록 등 극도로 민감한 개인 정보가 포함되어 있었다.12
이 사건은 기술 프로젝트를 넘어, AI 시대의 사회적 거버넌스에 대한 전 세계적인 논의를 촉발하는 분수령이 되었다. 이는 AI 기술의 발전 속도와 그것을 규율해야 할 법적, 윤리적, 규제적 프레임워크 사이의 심각한 격차를 드러냈다. 딥마인드-NHS 파트너십은 AI 기술이 사회에 성공적으로 통합되기 위해서는 기술적 우수성만으로는 불충분하다는 것을 명백히 보여준 ‘경고성 사례(cautionary tale)’ 12가 되었다. 신뢰를 구축하고 견고한 거버넌스 구조를 확립하기 위해서는 윤리학자, 정책 입안자, 그리고 일반 대중을 포함하는 다중 이해관계자 간의 사회적 합의 과정이 필수적이라는 교훈을 남겼다. 이 사건은 이후 AI 윤리 및 거버넌스 분야가 학문적 논의의 장을 넘어, 주요 정책적 의제로 부상하는 데 결정적인 계기가 되었다.
6.2 LSTM 네트워크에 대한 심층 분석: 순환 신경망 이해의 대중화
2015년 8월 27일, 당시 Google 연구원이었던 크리스토퍼 올라(Christopher Olah)는 자신의 개인 블로그에 “Understanding LSTM Networks“라는 제목의 글을 게시했다.56 이 글은 순환 신경망(Recurrent Neural Networks, RNN)의 한 종류로, 장기 의존성 문제를 해결하여 당시 자연어 처리 및 시계열 데이터 분석에서 각광받던 LSTM(Long Short-Term Memory) 네트워크의 복잡한 내부 작동 원리를 탁월한 시각 자료와 직관적인 설명으로 풀어냈다.
이 글은 정식 학술 논문이 아니었음에도 불구하고, 그 파급력은 웬만한 최상위 학회 논문을 능가했다. LSTM의 핵심인 셀 상태(cell state), 입력 게이트, 망각 게이트, 출력 게이트의 역할과 정보 흐름을 단계별로 시각화하여 설명함으로써, 복잡한 수학적 수식에 익숙하지 않은 수많은 연구자와 개발자들이 LSTM의 핵심 아이디어를 깊이 있게 이해할 수 있도록 도왔다.
이 사건은 AI 분야에서 고품질의 교육적 콘텐츠와 명료한 과학적 커뮤니케이션이 기술의 민주화와 확산에 얼마나 중요한 역할을 하는지를 보여주는 상징적인 사례이다. 올라의 블로그 글은 LSTM과 RNN에 대한 이해의 장벽을 극적으로 낮추었고, 이는 더 많은 인재들이 자연어 처리, 음성 인식, 기계 번역 등 관련 딥러닝 연구 분야로 유입되는 계기를 마련했다. 이는 오픈소스 소프트웨어뿐만 아니라, 지식 자체를 개방하고 공유하는 문화가 AI 생태계의 발전을 가속화하는 핵심 동력임을 입증했다.
6.3 페이스북 AI 연구소(FAIR)의 다각적 접근
2015년, 페이스북 AI 연구소(FAIR)는 파리에 새로운 연구소를 설립하는 등 AI 연구에 대한 투자를 공격적으로 확대하고 있었다.57 FAIR는 딥러닝의 특정 분야에만 집중하기보다는, 컴퓨터 비전, 자연어 처리, 강화학습, 그리고 이들을 융합하는 멀티모달 AI에 이르기까지 다각적인 연구를 수행했다.
이 시기 FAIR의 주목할 만한 연구 방향 중 하나는 시각과 언어를 동시에 이해하는 능력에 대한 탐구였다. 대표적인 예가 시각적 질의응답(Visual Question Answering, VQA) 연구이다.59 VQA는 이미지와 그 이미지에 대한 자연어 질문이 주어졌을 때, 올바른 답변을 생성하는 과제로, 진정한 의미의 시각-언어 이해 능력을 평가하는 벤치마크로 제안되었다.60
이와 더불어 FAIR는 **메모리 네트워크(Memory Networks)**에 대한 연구를 심화시켰다.59 메모리 네트워크는 신경망 외부에 명시적인 메모리 구성 요소를 두어, 장기적인 정보를 저장하고 필요할 때 이를 읽어와 추론에 활용하는 아키텍처이다. 이는 단기적인 문맥만 기억하는 기존 RNN의 한계를 극복하고, 여러 문장이나 사실 관계에 걸친 복잡한 추론을 가능하게 했다.61
FAIR의 VQA와 메모리 네트워크 연구는 단일 양식(modality)의 데이터를 처리하는 것을 넘어, 여러 양식의 정보를 통합하고 외부 지식을 활용하여 추론하는 멀티모달 AI의 기틀을 닦았다. 이러한 초기 연구들은 이후 수많은 후속 연구를 촉발시켰으며, 오늘날 이미지 캡셔닝, 텍스트-이미지 생성, 그리고 대규모 언어 모델(LLM)과 비전-언어 모델(VLM)의 핵심적인 연구 주제로 직접적으로 이어지고 있다.63
7. 결론: 2015년 3분기 연구 동향 종합 및 미래 전망
7.1 핵심 연구 성과들의 상호 연관성 분석
2015년 3분기는 인공지능 기술 스택의 여러 계층에서 중요한 진보가 동시다발적으로 이루어진 시기였다. 이 시기의 연구 성과들은 독립적으로 존재하기보다 서로 유기적으로 연결되어 AI 기술 생태계 전체의 발전을 견인했다. ICML에서 발표된 배치 정규화는 심층 신경망의 훈련을 안정화하고 가속화하는 범용적인 도구를 제공했다. 이 기술은 이후 개발될 거의 모든 종류의 심층 신경망, 즉 TRPO와 같은 강화학습 알고리즘에서 사용되는 정책 및 가치 신경망, 또는 직접 SLAM에서 사용될 수 있는 심층 특징 추출기 등의 성능 향상에 간접적으로, 그러나 결정적으로 기여했다. 더 깊고 복잡한 네트워크를 신뢰성 있게 훈련할 수 있는 기반이 마련됨으로써, 다른 분야의 연구자들이 더 과감한 모델 아키텍처를 시도할 수 있는 문이 열린 것이다.
마찬가지로, RSS와 IROS에서 발표된 로봇 공학 연구들은 이러한 향상된 AI 및 머신러닝 도구들을 적극적으로 활용하여, 불확실성이 가득한 실제 물리적 세계에서 로봇이 더 강건하고 지능적으로 작동할 수 있는 길을 열었다. 다양체 기반 IMU 사전 통합과 같은 연구는 수학적으로 정교한 모델링을 통해 센서 데이터의 불확실성을 원칙적으로 다루었으며, 이는 AI 기반 고수준 인식 및 계획 알고리즘에 신뢰할 수 있는 저수준 상태 추정치를 제공하는 데 필수적이다.
7.2 딥러닝, 로보틱스, AI 이론의 융합 동향
2015년 3분기는 딥러닝이라는 강력한 도구가 로보틱스, 인간-로봇 상호작용(HRI), 그리고 인과 추론과 같은 고전적인 AI 분야와 어떻게 상호작용하고 융합될 수 있는지를 명확하게 보여주었다. 이 시기를 거치며, 딥러닝이 모든 문제를 해결하는 ’만능 해결사’가 아니라는 인식이 확산되기 시작했다. 대신, 각 분야의 고유한 문제 정의와 이론적 프레임워크(예: POMDP, 구조 방정식 모델) 내에서, 딥러닝이 강력한 비선형 함수 근사기(function approximator) 또는 고차원 데이터로부터 유용한 특징을 추출하는 특징 추출기(feature extractor)로 활용될 때 가장 큰 시너지를 낼 수 있다는 이해가 깊어졌다. 예를 들어, ‘공유 자율성’ 연구에서는 POMDP라는 의사결정 이론의 틀 안에서, 사용자의 의도를 추론하는 부분에 딥러닝 기반의 모델을 적용할 수 있는 가능성을 열었다. 이처럼 각 분야의 도메인 지식과 딥러닝의 데이터 기반 학습 능력을 결합하려는 시도는 이후 AI 연구의 중요한 흐름이 되었다.
7.3 이후 AI 기술 발전에 미친 영향
2015년 3분기에 제시된 아이디어와 기술들은 이후 AI 기술 지형을 근본적으로 바꾸는 씨앗이 되었다. 아래 표는 본 보고서에서 분석한 주요 연구들과 그 장기적 영향을 요약한 것이다.
| 논문 제목 (Paper Title) | 핵심 기여 (Key Contribution) | 발표 학회 (Conference) | 장기적 영향 (Long-Term Impact) |
|---|---|---|---|
| Trust Region Policy Optimization | 단조로운 성능 향상을 보장하는 강화학습 알고리즘 제안 | ICML 2015 | PPO 알고리즘의 직접적인 이론적 기반이 되어 심층 강화학습의 표준 방법론을 정립함 22 |
| Batch Normalization: Accelerating Deep Network Training | 내부 공변량 변화 문제 해결을 통한 딥러닝 훈련 가속화 및 안정화 | ICML 2015 | ResNet 등 초심층 신경망 훈련의 필수 기술로 정착하여 딥러닝 모델의 깊이 한계를 극복하는 데 기여함 26 |
| IMU Preintegration on Manifold for Efficient Visual-Inertial… | SO(3) 다양체 기반의 수학적으로 정교하고 효율적인 VIO 방법론 제시 | RSS 2015 | VINS-Mono 등 현대 고성능 VIO/SLAM 시스템의 표준 방법론으로 채택되어 자율 이동체의 항법 기술 발전을 선도함 |
| Shared Autonomy via Hindsight Optimization | 사용자 의도 불확실성을 POMDP로 모델링하고 후견 최적화로 해결 | RSS 2015 | 지능형 보조 시스템 및 HRI 분야에서 불확실성을 다루는 원칙적인 결정 이론 프레임워크의 중요성을 제시함 |
| A Modification of the Halpern-Pearl Definition of Causality | 더 간결하고 직관적이며 계산적으로 효율적인 실제 인과성 정의 제안 | IJCAI 2015 | 설명가능 AI(XAI) 및 인과 추론 분야의 이론적 기반을 강화하고 형식적 명료성을 높이는 데 기여함 |
| Large-Scale Direct SLAM for Omnidirectional Cameras | 직접 SLAM 기술을 전방위 카메라로 확장하여 강건성 및 시야각 확보 | IROS 2015 | 다양한 센서 모달리티를 SLAM에 통합하는 연구를 촉진하고, 드론 및 감시 로봇의 항법 능력 향상에 기여함 |
결론적으로, 2015년 3분기는 AI가 이론적 가능성을 넘어, 세상을 변화시키는 실용적이고 강력하며, 동시에 그 힘에 대한 사회적 책임을 요구받는 기술로 본격적으로 진입했음을 알리는 신호탄이었다. 이 시기에 이루어진 기초 연구의 성숙과 현실 세계 적용의 시작은 오늘날 우리가 경험하고 있는 AI 혁명의 근간을 이루고 있다.
8. 참고 자료
- Preparing for the Future of Artificial Intelligence - Obama White House, https://obamawhitehouse.archives.gov/sites/default/files/whitehouse_files/microsites/ostp/NSTC/preparing_for_the_future_of_ai.pdf
- What impact will artificial intelligence have on our jobs? | World Economic Forum, https://www.weforum.org/stories/2015/07/what-impact-will-artificial-intelligence-have-on-our-jobs/
- The Artificial Intelligence Revolution: Part 1 - Wait But Why, https://waitbutwhy.com/2015/01/artificial-intelligence-revolution-1.html
- icml.cc, https://icml.cc/2015/#:~:text=The%2032nd%20International%20Conference%20on,6%20%E2%80%93%20July%2011%2C%202015.
- Conferences - RSS Foundation, https://roboticsfoundation.org/conferences/
- ai100.stanford.edu, https://ai100.stanford.edu/about/history/ijcai-2015
- iros2015.informatik.uni-hamburg.de, https://iros2015.informatik.uni-hamburg.de/index.html#:~:text=The%202015%20IEEE%2FRSJ%20International,Lake%20and%20the%20town%20center.
- Batch Normalization: Accelerating Deep Network Training by …, https://proceedings.mlr.press/v37/ioffe15.html
- Trust Region Policy Optimization - People @EECS - University of …, https://people.eecs.berkeley.edu/~pabbeel/papers/2015-ICML-TRPO.pdf
- Awards | ICML Lille, https://icml.cc/2015/index.html%3Fp=51.html
- Google DeepMind - Wikipedia, https://en.wikipedia.org/wiki/Google_DeepMind
- DeepMind-Royal Free deal is “cautionary tale” for healthcare in the algorithmic age, https://www.cam.ac.uk/research/news/deepmind-royal-free-deal-is-cautionary-tale-for-healthcare-in-the-algorithmic-age
- Google DeepMind and healthcare in an age of algorithms - PMC - PubMed Central, https://pmc.ncbi.nlm.nih.gov/articles/PMC5741783/
- Google DeepMind and healthcare in an age of algorithms - ResearchGate, https://www.researchgate.net/publication/315112666_Google_DeepMind_and_healthcare_in_an_age_of_algorithms
- Past Conferences | ICML Lille, https://icml.cc/Conferences/2015/index.html%3Fp=175.html
- 32nd International Conference on Machine Learning (ICML 2015) - ICML Lille, https://icml.cc/2015/
- Deep Learning, https://icml.cc/2015/booklet-icml2015.online.pdf
- ICML Poster Simple Policy Optimization, https://icml.cc/virtual/2025/poster/45232
- Simple Policy Optimization - arXiv, https://arxiv.org/html/2401.16025v7
- Trust Region Policy Optimization | Request PDF - ResearchGate, https://www.researchgate.net/publication/319769991_Trust_Region_Policy_Optimization
- [1502.05477] Trust Region Policy Optimization - arXiv, https://arxiv.org/abs/1502.05477
- Neural Trust Region/Proximal Policy Optimization Attains Globally Optimal Policy, http://papers.neurips.cc/paper/9242-neural-trust-regionproximal-policy-optimization-attains-globally-optimal-policy.pdf
- Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift - ResearchGate, https://www.researchgate.net/publication/272194743_Batch_Normalization_Accelerating_Deep_Network_Training_by_Reducing_Internal_Covariate_Shift
- How Does Batch Normalization Help Optimization? - NIPS, http://papers.neurips.cc/paper/7515-how-does-batch-normalization-help-optimization.pdf
- Understanding the Impact of Batch Normalization on CNNs - TiDB, https://www.pingcap.com/article/understanding-the-impact-of-batch-normalization-on-cnns/
- Understanding Batch Normalization, http://papers.neurips.cc/paper/7996-understanding-batch-normalization.pdf
- Robotics: Science and Systems - Online Proceedings, https://www.roboticsproceedings.org/
- Robotics: Science and Systems Conference (RSS) - DBLP, https://dblp.org/db/conf/rss/index
- RSS 2015 : Robotics: Science and Systems Conference - WikiCFP, http://www.wikicfp.com/cfp/servlet/event.showcfp?eventid=40391©ownerid=60222
- IMU Preintegration on Manifold for Efficient Visual-Inertial Maximum …, https://rpg.ifi.uzh.ch/docs/RSS15_Forster.pdf
- (PDF) IMU Preintegration on Manifold for Efficient Visual-Inertial Maximum-a-Posteriori Estimation - ResearchGate, https://www.researchgate.net/publication/290180954_IMU_Preintegration_on_Manifold_for_Efficient_Visual-Inertial_Maximum-a-Posteriori_Estimation
- IMU Preintegration on Manifold for Efficient Visual-Inertial Maximum-a-Posteriori Estimation - Robotics, https://www.roboticsproceedings.org/rss11/p06.pdf
- Science and Systems XI - Online Proceedings - Robotics, https://www.roboticsproceedings.org/rss11/
- On-Manifold Preintegration for Real-Time Visual-Inertial Odometry - ResearchGate, https://www.researchgate.net/publication/286513661_On-Manifold_Preintegration_for_Real-Time_Visual-Inertial_Odometry
- Shared Autonomy via Hindsight Optimization - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC6329599/
- Shared Autonomy via Hindsight Optimization - Robotics, https://www.roboticsproceedings.org/rss11/p32.pdf
- [1503.07619] Shared Autonomy via Hindsight Optimization - arXiv, https://arxiv.org/abs/1503.07619
- [PDF] Shared Autonomy via Hindsight Optimization - Semantic Scholar, https://www.semanticscholar.org/paper/Shared-Autonomy-via-Hindsight-Optimization-Javdani-Srinivasa/2b5bf3e17f655aad45cd705d6b24a2d4e6cb2f5c
- Proceedings of the Twenty-Fourth International Joint Conference on …, https://www.ijcai.org/proceedings/2015
- Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence, IJCAI 2015, Buenos Aires, Argentina, July 25-31, 2015 - Researchr, https://researchr.org/publication/ijcai-2015
- Conference Overview - ijcai-15, https://ijcai-15.org/program/conference-overview/
- Preface - IJCAI, https://www.ijcai.org/Proceedings/15/Papers/001.pdf
- A Modification of the Halpern-Pearl Definition of Causality - IJCAI, https://www.ijcai.org/Proceedings/15/Papers/427.pdf
- IROS 2015, https://iros2015.informatik.uni-hamburg.de/
- Iros 2015 - Hamburg - qbrobotics, https://qbrobotics.com/events/iros-2015-hamburg/
- Our research presented at IROS 2015 - Robotics, Embodied AI, Navigation in vivo, http://www.labren.org/mm/news/our-research-presented-at-iros-2015/
- Visual SLAM - LSD-SLAM: Large-Scale Direct Monocular SLAM - Computer Vision Group, https://cvg.cit.tum.de/research/vslam/lsdslam
- Large-Scale Direct SLAM and 3D Reconstruction in Real-Time - Jakob Engel, https://jakobengel.github.io/pdf/JakobEngelPhD.pdf
- 2015 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROS 2015, Hamburg, Germany, September 28 - October 2, 2015 - Researchr, https://researchr.org/publication/iros-2015
- Large-scale direct SLAM for omnidirectional cameras - Semantic Scholar, https://www.semanticscholar.org/paper/Large-scale-direct-SLAM-for-omnidirectional-cameras-Caruso-Engel/b77d873970f5c7731373a6040b47d44ed1b6addd
- Large-scale direct SLAM for omnidirectional cameras | Request PDF - ResearchGate, https://www.researchgate.net/publication/308821220_Large-scale_direct_SLAM_for_omnidirectional_cameras
- Designing Information Gathering Robots for Human-Populated …, https://www.pronobis.pro/publications/chung2015iros/
- (PDF) Designing information gathering robots for human-populated environments, https://www.researchgate.net/publication/308819532_Designing_information_gathering_robots_for_human-populated_environments
- InfoBot - Information Gathering Robot Answering Natural Language Questions About the Environment - Andrzej Pronobis, https://www.pronobis.pro/projects/infobot/
- Google DeepMind | PDF | Artificial Intelligence - Scribd, https://www.scribd.com/document/803553134/Google-DeepMind
- Understanding LSTM Networks - colah’s blog, https://colah.github.io/posts/2015-08-Understanding-LSTMs/
- FAIR Paris - Meta AI, https://ai.meta.com/research/fair-paris/
- The state of AI in 2015 – Digital Society Blog, https://www.hiig.de/en/the-state-of-ai-in-2015/
- FAIR at 5: Facebook Artificial Intelligence Research accomplishments - Engineering at Meta, https://engineering.fb.com/2018/12/05/ai-research/fair-fifth-anniversary/
- New Milestones in Artificial Intelligence Research - About Meta, https://about.fb.com/news/2015/11/new-milestones-in-artificial-intelligence-research/
- End-To-End Memory Networks - Meta Research - Facebook, https://research.facebook.com/publications/end-to-end-memory-networks/
- End-To-End Memory Networks | Facebook AI Research - Meta AI, https://ai.meta.com/research/publications/end-to-end-memory-networks/
- Research on visual question answering based on dynamic memory network model of multiple attention mechanisms - PMC, https://pmc.ncbi.nlm.nih.gov/articles/PMC9537137/
- FVQA: Fact-based Visual Question Answering | Request PDF - ResearchGate, https://www.researchgate.net/publication/304128114_FVQA_Fact-based_Visual_Question_Answering
- [1806.04860] Learning Visual Knowledge Memory Networks for Visual Question Answering - arXiv, https://arxiv.org/abs/1806.04860
- Path-Wise Attention Memory Network for Visual Question Answering - MDPI, https://www.mdpi.com/2227-7390/10/18/3244